首页> 外文OA文献 >Estimating Risks of Identification Disclosure in Partially Synthetic Data
【2h】

Estimating Risks of Identification Disclosure in Partially Synthetic Data

机译:估计部分合成数据中身份披露的风险

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

To limit disclosures, statistical agencies and other data disseminators can release partially synthetic, public use microdata sets. These comprise the units originally surveyed; but some collected values, for example, sensitive values at high risk of disclosure or values of key identifiers, are replaced with multiple draws from statistical models. Because the original records are on the file, there remain risks of identifications. In this paper, we describe how to evaluate identification disclosure risks in partially synthetic data, accounting for released information from the multiple datasets, the model used to generate synthetic values, and the approach used to select values to synthesize. We illustrate the computations using the Survey of Youths in Custody.
机译:为了限制披露,统计机构和其他数据传播者可以发布部分合成的,公共用途的微数据集。这些包括最初调查的单位;但是某些收集的值(例如,具有高披露风险的敏感值或关键标识符的值)被统计模型的多次抽取所取代。由于原始记录在文件中,因此仍然存在识别风险。在本文中,我们描述了如何评估部分合成数据中的识别披露风险,如何考虑来自多个数据集的已发布信息,用于生成合成值的模型以及用于选择值进行合成的方法。我们使用“在押青少年调查”来说明计算方法。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号